import urllib.request 
data = urllib.request.urlopen("http://www.jd.com").read().decode("utf-8","ignore")
#                      打开网址                 获取内容     编码方式 采用utf-8  如果不能解码 则忽略
print(len(data) )

# 导入正则

import re
pat = "<title>(.*?)</title>"
res = re.compile(pat , re.S).findall(data)
print(res)

# 保存到本地
urllib.request.urlretrieve("http://www.jd.com" ,"aa.html")
